共计 3871 个字符,预计需要花费 10 分钟才能阅读完成。
一. 用途
1. 关系运算
- 交集 :
&
- 并集 :
|
- 差集 :
-
- 交叉补集 :
^
2. 去重
- 简单示例
l = [1,1,2,2,1,3]
s = set(l)
print(list(s)) #[1,2,3]
二. 定义方式
- 在 "{}" 内用逗号分隔开一个个元素
- 集合的元素必须是不可变类型
- 集合内元素无序
- 集合内元素唯一
- 集合的 "工厂" :
set
s={1,2,3,4,4,4,4,4,4,4,'a'}
🍉背后的操作就是
s=set({1,2,3,4,'a'})
🍉如果元素重复, 只会取一个
print(type(s),s)
#<class 'set'> {1, 2, 3, 4, 'a'}
🍉加入可变类型报错
s={[1,2,3],'aa'} #报错
🍉无序的
s = {1,2,"b",4,"a",6,7}
print(s) #{1, 2, 4, 6, 7, 'b', 'a'}
ps : 定义空集合 与 定义空字典
🍉定义空集合
s = set()
print(s,type(s))
#set() <class 'set'>
🍉定义空字典
dic = {}
print(dic,type(dic))
#{} <class 'dict'>
三. 类型转换
- 只要存在可变类型就无法转换, 会报错
- 我们说字典的 key 是不可变类型, value 是任意类型, 所以转换时转的就是字典的 key, 而不是 value
🍉整型 ---> 集合
# res = set({1, 2, 3, 4})
res = {1, 2, 3, 4}
print(res, type(res))
# {1, 2, 3, 4} <class 'set'>
🍉浮点型 ---> 集合
# res1 = set({1.1, 2.2, 3.3, 4.4})
res = {1.1, 2.2, 3.3, 4.4}
print(res, type(res))
# {1.1, 2.2, 3.3, 4.4} <class 'set'>
🍉字符串 ---> 集合
res = set('shawn')
print(res, type(res))
# {'a', 'h', 'n', 'w', 's'} <class 'set'>
🍉元组 ---> 集合
res = set((1, 2, 3, (1, 2, 3)))
print(res, type(res))
# {1, 2, 3, (1, 2, 3)} <class 'set'>
🍉字典 ---> 集合
🐳存到集合里面的是字典的 key (不可变)
res = set({'name':'shawn','age':22})
print(res, type(res))
# {'name', 'age'} <class 'set'>
🍉整型、浮点型、字符串、元组、综合 ---> 集合
res = set((2, 1.1,"song", (111, 222)))
print(res, type(res))
#{1.1, 2, (111, 222), 'song'} <class 'set'>
🐳当综合里边存在字典 (可变类型) 时无法转换, 并报错
res = set((2, 1.1,"song", (111, 222),{'name': 'shawn', 'age': 22}))
print(res, type(res)) #报错
四. 常用操作
🐹关系运算
🍉之后就以以下示例来讲解
linux=["song","hai","xing","shawn","shang",] #学 Linux 的学生
python=["shang","hai","qing","pu","qu","hi"] #学 Python 的学生
🐳使用 "for" 循环取出两个都学的学生
linux_python=[]
for s in linux:
if stu in python: #两个都学的学生
linux_python.append(s) #加入到列表里面
print(linux_python) #["shang","hai"]
- 图解
1. 交集 : &
, .intersection()
🍉取出两门课程都学习的学生
linux={"song","hai","xing","shawn","shang",}
python={"shang","hai","qing","pu","qu","hi"}
print(linu & python) #["shang","hai"]
print(linux.intersection(python)) #["shang","hai"]
2. 并集 : |
, .union()
🍉取出全部的学生
print(linux | python)
#{'shawn', 'qing', 'hai', 'song', 'hi', 'qu', 'xing', 'shang', 'pu'}
print(linux.union(python))
#{'shawn', 'qing', 'hai', 'song', 'hi', 'qu', 'xing', 'shang', 'pu'}
3. 差集 : -
, .difference()
🍉只学习 "linux" 的, 没学习 "python" 的 (在 "linux" 班级里看)
print(linux - python) #{'song', 'xing', 'shawn'}
print(linux.difference(python)) #{'song', 'xing', 'shawn'}
🍉只学习 "python" 的, 没学习 "linux" 的 (在 "python" 班级里看)
print(python - linux) #{'qing', 'qu', 'hi', 'pu'}
print(python.difference(linux)) #{'qing', 'qu', 'hi', 'pu'}
4. 对称差集 : ^
, .symmetric_difference()
🍉两个班级加起来看只学习了一门课程的学生
print(stus_linux ^ stus_python)
# {'pu', 'qing', 'shawn', 'xing', 'song', 'qu', 'hi'}
print(stus_linux.symmetric_difference(stus_python))
# {'pu', 'qing', 'shawn', 'xing', 'song', 'qu', 'hi'}
5. 父集:>=
, .issuperset()
s1={1,2,3,4,5}
s2={3,2,1}
print(s1 >= s2) #True
print(s1.issuperset(s2)) #True
6. 子集 : <=
, .issubset()
print(s2 <= s1)
print(s2.issubset(s1))
ps:如果两两相同,则互为父子集
🐰去重
1. 简单去重(无法保证顺序)
s1=set('hello')
print(s1) #{'l','h','o','e'}
🍉将一个列表去重
l=['a','b',1,'a','a']
print(list(set(l))) #先变成集合去重,再 list 变成列表
#[1,'a','b'] 无法保证顺序
2. 去重并保证原来的顺序(了解)
l = ['a', 'b', 1, 'a', 'a']
l2=[]
s=set()
🍉通过 "for" 循环一个一个取, 一个一个加
for item in l:
if item not in s:
l2.append(item) #l2=['a','b',1] 一个一个加进来
print(l2) #['a','b','1']
五. 内置方法
🐼优先掌握的操作(***)
1. 长度 : .len()
s1={1,'a','b','c','d'}
print(len(s1)) #5
2. 成员运算 in 和 not in
s1={1,'a','b','c','d'}
print(len(s1))
s1={1,'a','b','c','d'}
print("c" in s1) #True
print("c" not in s1) #False
3. 循环取值
- 集合是无序的, 所以使用 for 循环取出来的值也是无序的
s1={1,'a','b','c','d'}
for i in s1:
print(i)
# d
# 1
# c
# b
# a
🐨需要掌握的操作(****)
1. 更新 .update()
- 新集合更新旧集合, 有则不添加, 无则添加
- 可以一次添加多个值
s1={'a','b','c'}
s1.update({"a",3,4,5})
print(s1) # {'a','b','c',3,4,5}
2. 添加 .add()
- 一次只能添加一个值
s1={'a','b','c'}
s1.add(4)
print(s1) #{'c', 'b', 'a', 4}
3. 取走一个值 .pop()
- 不指定参数, 随机删除集合中的任意元素, 并且返回这个值
s={"aaa",22,3,"bbb"}
res=s.pop()
print(s) #{3, 'aaa', 22}
print(res) #bbb
4. 删除 .remove(), .discard()
- .remove() : 当删除的元素不存在时, 报错
- .discard() : 当删除的元素不存在时, 不报错
s1={'a','b','c'}
🍉"remove" 删除
s1.remove(4) #报错
🍉"discard" 删除
s1.discard(4) #不报错
5. 无交集 .isdisjoint()
- 如果两个集合没有任何交集则返回 True
🍉无交集实验
s1={1,2,3}
s2={4,5,6}
print(s1.isdisjoint(s2)) #T
print(s2.isdisjoint(s1)) #T
🍉有交集实验
s1={1,2,3}
s2={4,5,6,3}
print(s1.isdisjoint(s2)) #T
print(s2.isdisjoint(s1)) #T
🐻不怎么需要了解的操作(***)
1..difference_update()
2..intersection_ update()
3..symmetric_ difference_ update()
五. 总结
-
可以存多个值
-
无序
-
可变类型 ---> 不可 hash 类型
ps : 集合里面的值必须不可变
正文完